11.3 상상 속에서의 학습: The Dreamer Architectures 11.3 상상 속에서의 학습: The Dreamer Architectures 11.3.1 DreamerV1: 잠재 공간에서의 가치 함수 학습과 정책 최적화 11.3.2 DreamerV2: 이산적 잠재 변수(Discrete Latent Variables)를 통한 장기 예측 안정화 11.3.3 DreamerV3: 스케일링을 위한 Symlog 변환과 하이퍼파라미터 튜닝의 자동화 11.3.4 DayDreamer: 물리 로봇을 위한 실시간 온라인 학습 및 배포 전략